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基于 弱 监 督 下 改进 的 CBAM-ResNet18 模型 
识别 苹果 多 种 叶 部 病害 
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摘 要 : 针对 苹果 叶 部 病害 图 像 在 仅 有 图 像 类 别 标注 的 弱 监 督 的 条 件 下 识别 准确 率 低 的 问题 ， 提 出 了 一 种 基于 改 
进 的 CBAM-ResNet 算 法 进行 苹果 叶 部 病害 识别 。 以 ResNet18 作 为 基础 模型 ， 对 轻 量 级 卷 积 块 注意 力 模块 (Convo- 
lutional Block Attention Module, CBAM) 注意 力 机 制 中 通道 注意 力 模 块 中 的 多 层 感 知 机 (Multilayer Perceptron, 


MLP) 进行 升 维 改 进 ， 放 大 苹果 叶 部 病害 特征 细节 ; 将 改进 的 CBAM 融和 人 残 差 模块 中 ， 


Ne 


加 强 对 关键 细节 特征 的 


提取 ， 将 AlphaDropout 配 合 SeLU (Scaled Exponential Linearunits) 融入 网 络 中 ， 防 止 其 网 络 的 过 拟 合 化 ， 加 速 模型 


收敛 效果 ; 最 后 ， 采 用 单 周 大 
注 的 弱 监 督 下 进行 ， 大 大 降低 标注 成 本 。 通 


余弦 退火 算法 调整 学 习 率 ， 得 到 病害 识别 模型 。 训 练 在 样本 图 像 均 只 进行 图 像 级 标 


过 消融 实验 ， 探 究 出 改进 CBAM 中 MLP 最 佳 升 维 维度 为 2， 相 对 于 原 


CBAM， 准 确 率 提升 0.32%， 并 在 参数 量 增 加 17.59% 的 情况 下 ， 每 轮训 练 时 长 减少 8 s。 在 包含 苹果 斑点 落叶 病 、 
褐 斑 病 、 花 叶 病 、 灰 斑 病 、 锈 病 等 5 种 病害 的 6185 幅 图 像 数据 集 上 进行 了 试验 测试 ， 结 果 显 示 ， 在 弱 监 督学 习 下 ， 
识别 准确 率 方面 ， 该 模型 对 苹果 5 种 病害 的 平均 识别 准确 率 达 到 98.44%， 改 进 的 CBAM-ResNet18 相 比 改 进 前 的 
ResNet18 提高 了 1.47%， 且 高 于 VGG16，DesNet121，ResNet50，ResNeXt50，EfficientNet-B0O 和 Xception 对 照 模 


型 ;在 学 习 效 率 方面 ， 改 进 的 CBAM-ResNet18 相对 了 


少 


>Os, 


速度 完成 模型 训练 。 


BR, AEA 


F ResNet18 在 参数 量 增加 24.9% 的 条 件 下 ， 每 轮 的 训练 时 间 减 
在 VGG16, DesNet121, ResNet50, ResNeXt50, EfficientNet-B0 FI Xception 对 照 模型 中 以 每 轮 137 s 最 快 


通过 混淆 矩阵 结果 ， 计 算出 模型 的 精确 度 平 均值 、 召 回 率 平 均值 入 分 数 平均 值 分 别 达 到 了 
98.43% 、98.46% 和 0.9845。 该 结果 表明 ， 改 进 的 CBAM-ResNet 模 型 可 进行 苹果 叶 部 病害 识别 且 具 有 和 良好 的 识别 


叶 部 病害 智能 识别 提供 技术 文 撑 。 
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病害 是 造成 苹果 减产 、 降 质 、 降 低 商 品 价值 的 
重要 因素 ， 及 时 准确 识别 病害 对 及 时 防治 、 减 少 经 
济 损失 具有 重要 意义 。 早 期 的 病害 识别 主要 是 通过 
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人 工 现场 检查 完成 ， 费 时 费力 ， 易 受 主观 影响 ， 因 
而 识别 准确 率 和 效率 较 低 。 基 于 数字 图 像 处 理 和 机 
顺 学 习 的 病害 识别 技术 极 大 地 推动 了 病害 检测 、 识 
别 与 诊断 水 平 。 但 传统 机 带 学 习 技 术 中 由 于 图 像 特 
征 提取 困难 ， 在 面 对 复 杂 背 景 时 ,算法 鲁 棒 性 不 
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足 ， 精 度 不 高 。 

近年 来 ， 深 度 学 习 技 术 在 作物 病害 识别 中 得 到 
广泛 人 研究 并 取得 了 很 好 的 效果 。Zhu 等" AH In- 
ception V2 的 批量 归 一 化 (Batch Normalization， 
BN) 为 区 域 提 议 网 络 (Region Proposal Network, 
RPN) 提供 多 尺度 图 像 特 征 ， 在 复杂 的 背景 环境 下 
进行 植物 叶子 识别 ， 取 得 良好 效果 。 丁 永 军 等 ?” 
以 VGG-16 模 型 为 基础 构建 卷 积 胶 吉 网 络 ， 提 高 了 
百合 病害 诊断 模型 的 抗 噪 能 力 。Li 等 ”为 构建 植 
物 病虫害 视频 检测 系统 ， 提 出 了 一 种 基于 深度 学 习 
的 自 定义 主干 突出 信息 区 域 以 提高 模型 的 识别 能 
Ti, 模型 具有 良好 的 鲁 棒 性 。 周 巧 黎 等 “提出 了 
基于 改进 MobileNetV3 的 番茄 叶片 病害 分 类 识别 方 
法 ,实现 盔 苘 病害 的 实时 无 损伤 检测 。 深 度 学 习 虽 
然 在 识别 准确 率 上 取得 了 明显 优势 ， 但 需 以 大 量 精 
确 标注 的 图 像 为 基础 。 而 在 病害 识别 任务 中 ， 由 于 
受到 专业 领域 知识 、 复 杂 背 景 和 目标 多 样 等 因素 影 
响 ， 标 注 成 本 非常 高 G 而 无 监督 学 习 往 往 难以 在 
复杂 背景 下 取得 良好 结果 “。 如 何 利 用 实际 中 存在 
大 量 不 精确 标注 的 样本 ， 进 行 模型 学 习 并 获得 足够 
高 的 识别 性 能 是 当前 号 待 解决 的 问题 "。 在 此 背景 
下 ， 弱 监督 学 习 “ ”受到 较 多 关注 。 在 图 像 识别 任 
务 中 ， 弱 监督 学 习 只 要 求 标注 图 像 层 次 的 信息 ， 即 
只 标注 图 像 类 别 而 不 标注 图 像 中 目标 的 具体 位 置 ， 
即 可 训练 模型 并 进行 识别 。Durand 等 提出 的 深 
度 卷 积 网 络 的 弱 监督 学 习 方法 (Weakly supervised 


Learning of Deep Convolutional Neural Networks, 


能 。 对 于 苹果 病害 识别 问题 ， 虽 然 强 监 督学 习 网 络 
对 病害 的 识别 获得 较 好 的 效果 ， 但 标注 成 本 高 ， 
病害 样本 少 。 现 有 的 弱 监 督学 习 对 复杂 背景 的 苹果 
病害 图 像 仍 无 法 快速 有 效 学 习 到 叶 部 病害 细节 特 
征 ， 存 在 学 习 效 率 低 、 不 易 收敛 的 问题 。 

针对 像素 级 高 精度 标注 数据 集 缺 乏 ， 而 目前 弱 
监督 下 无 法 有 效 关注 密集 的 苹果 叶 部 病害 小 目标 ， 
导致 模型 学 习 效率 低 、 收 敛 不 稳定 的 问题 ， 本 文 提 
出 了 改进 的 CBAM-ResNet18 模 型 ， 该 模型 采用 升 
维 多 层 感知 机 (Multilayer Perceptron, MLP) 改进 
卷 积 块 注意 力 模块 (Convolutional Block Attention 
Module, CBAM) 中 的 通道 注意 力 机 制 ， 并 将 改进 
的 CBAM 引入 ResNet18 模型 中 ， 将 AlphaDropout 
模块 引入 模型 同时 配合 激活 函数 (Scaled Exponen- 
tial Linearunits, SeLU) 使 用 防止 模型 过 拟 合 ， 采 
用 余弦 退火 学 习 率 调整 学 习 率 ， 在 仅 利用 图 像 级 的 
类 别 标签 的 弱 监 督 下 训练 模型 ， 实 现 了 对 苹果 叶 部 
病害 的 准确 识别 。 


2 试验 材料 与 方法 


2.1 苹果 叶 部 病害 图 像 获 取 


苹果 叶 部 的 斑点 落叶 病 、 神 斑 病 、 花 叶 病 、 灰 
斑 病 、 锈 病 的 出 现 数 量 较 多 ， 分布 范围 较 广 ， 在 苹 
果 叶 部 的 分 布 尺 寸 小 且 十 分 密集 ， 对 细节 特征 提取 
的 要 求 较 高 ， 识 别 难度 较 高 ， 故 本 人 研究 选用 这 5 种 


WILDCAT)， 在 空间 性 不 变 约束 下 ， 学 习 多 层次 局 
部 强化 特征 ， 在 图 像 分 类 、 弱 监督 对 象 定位 和 语义 
分 制 等 3 个 视觉 识别 任务 上 取得 良好 效果 。 
弱 监 督学 习 的 关键 问题 是 在 缺少 像素 级 的 标注 
下 如 何 有 效 关注 到 图 像 中 的 特征 。 由 于 注意 力 机 制 
可 自动 聚焦 图 像 中 重要 区 域 的 学 习 ， 通 过 为 各 通道 
分 配 不 同 权 重 ， 使 模型 学 习 更 加 灵活 ， 因 此 被 广泛 
用 于 弱 监 督学 习 中 。Choe 和 Shim "提出 了 一 个 基 
于 注意 力 的 (Attention-Based Dropout Layer， 
ADL)， 利 用 自 注 意 力 机 制 处 理 模型 特征 图 ， 突 出 
信息 区 域 以 提高 模型 的 识别 能 力 。 在 判定 定位 的 深 
度 特征 方面 ，Zhou 等 '” 提出 对 全 局 平均 池 化 层 进 
行 调整 ， 使 得 卷 积 神经 网 络 保留 其 优异 的 定位 性 


苹果 叶 部 病害 作为 识别 对 象 。 研 究 所 用 图 像 数 据 一 
部 分 来 自 2019 年 周 敏 敏 "在 西北 农林 科技 大 学 白 
水 苹果 试验 站 (109%"33'32"N，35?"12'45"E) 、 洛 川 
苹果 试验 站 (109°22'35"N, 35°47'25"E) FRIRE 
果 试 验 站 (107°55'36"N, 36°0'30"E) 3 个 站 点 采集 
的 苹果 叶 面 病害 图 像 ， 分 别 在 上 晴天、 阴 天 、 雨 天 等 
不 同 条 件 下 共 采 集 3217 幅 图 像 ， 分 辨 率 像 素 为 
512X512; 另 一 部 分 于 2022 年 7~10 月 在 陕西 省 蓝 
BSE SE RR BK (108° 6'33"N, 34°27'28"E) 利用 
iPhonell 手机 在 自然 光照 下 采集 像素 为 5312X512 的 
图 像 共 1237 幅 。 两 个 数据 集 均 包 含 单一 和 复杂 缘 
景 下 的 苹果 斑点 落叶 病 、 褐 斑 病 、 花 叶 病 、 灰 斑 
病 、 锈 病 等 5 种 常见 病害 ， 如 图 1 所 示 。 
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(a) 斑 点 落叶 病 (b) #3 REJA 


2.2 ”病害 图 像 预 处 理 


2.2.1 数据 增强 

为 提高 模型 的 泛 化 能 力 、 在 复杂 背景 下 的 抗 干 
扰 能 力 ， 以 及 避免 训练 过 拟 合 ， 对 图 像样 本 进行 数 
据 增强 ”“。 在 周 敏 敏 ”采集 的 预 训练 数据 集中 ， 
采用 了 两 次 图 像 旋转 ， 一 次 水 平和 垂直 镜像 ， 两 次 
锐 度 值 、 两 次 亮度 值 和 两 次 对 比 度 调整 ， 一 次 高 斯 
模糊 一 共 11 种 数据 增强 方式 ， 最 终 预 训练 集中 共有 
24,348 幅 病 害 图 片 。 对 在 陕西 省 乾 县 某 苹 果园 拍摄 
的 图 片 采 用 转动 、 偶 移 、 翻 转 和 亮度 变化 4 类 数据 
增强 方式 对 图 像 进行 扩充 ， 得 到 6185 幅 病 害 照片 。 
最 终 得 到 一 个 共计 30,533 幅 图 像 的 数据 集 ， 统 一 裁 
前 为 224X224 像 素 大 小 的 图 像 ， 用 于 模型 训练 和 
测试 。 病 害 图 像 划 分 的 具体 情况 如 表 1 所 示 ， 由 于 
在 周 敏 敏 '“ 采集 的 数据 集 上 训练 所 得 模型 在 实地 
拍摄 中 无 法 获得 良好 的 效果 ， 为 对 其 进行 改进 ， 本 
研究 采用 迁移 学 习 将 周 敏 敏 '“ 采集 的 数据 集 作为 
预 训练 样本 ， 并 将 其 按 4 : 1 划分 为 预 训练 集 与 验 
证 集 。 陕 西 省 乾 县 某 苹 果园 拍摄 的 图 片 作为 测试 样 
本 ， 将 其 按照 3 : 1 划分 为 迁移 训练 集 与 测试 集 。 

表 1 苹果 叶 部 病害 数据 
Table 1 Apple leaf disease data 


本 预 训练 病害 数据 集 训练 病害 数据 集 
原始 增强 ， 、 Sth A 
类 别 总数“ 总数 训练 集 验证 集 ay gy 训练 集 测 证 集 
= 

ne 411 4932 3700 1232 248 1240 927 313 


褐 斑 病 435 5220 3915 1305 258 1290 977 313 
花 叶 病 375 4500 3375 1125 229 1145 861 284 


灰 斑 病 370 4440 3330 1110 250 1250 936 314 
锈病 438 5256 3942 1314 252 1260 943 317 
总 数 2029 24,348 18,262 6086 1237 6185 4644 1541 


(c) 花 叶 病 
图 1 5 种 苹果 叶 部 病害 图 像 
Fig. 1 Images of five apple leaf diseases 
2.2.2 图像 标注 
本 研究 对 图 像 只 进行 图 像 类 别 标注 ， 不 对 图 像 
进行 像素 级 标注 ， 将 每 种 病害 图 像 归 为 同一 类 型 样 
本 ， 从 而 降低 标注 成 本 。 


(d) KSEI (e) 锈 病 


3 病害 识别 模型 构建 


3.1 ResNet 模 型 


针对 网 络 易 出 现 梯度 消失 和 梯度 爆炸 的 问题 ， 
2015 年 何 已 明 等 "提出 了 在 跳跃 连接 和 恒 等 映 射 
基础 上 的 残 差 网 络 (Residual Network，ResNet) , 
如 图 2 所 示 。 


| Weight layer | 


H(x)=F(x)+tx 


图 2 ResNet 残 差 结 构 
Fig. 2 ResNet residual structure 

x 为 输入 信和 号， 经 过 二 次 线性 变化 得 到 及 (x)。 
在 模型 学 习 过 程 中 ， 输 出 信号 妃 (x) 趋 于 稳定 ， 
且 原 本 带 权 值 的 x 变 为 恒 等 映射 ， 使 得 输出 信号 
H (x) 与 输入 信号 x 相 等 "。 

对 于 蔷 果 叶 部 病害 的 识别 ， 考 虑 到 大 多 数 场景 
需要 在 移动 设备 上 短 时 间 正 确 识别 病害 ， 应 采用 参 
数量 较 小 的 残 差 网 络 模型 ， 故 本 人 研究 采用 
ResNet18。 


3.2 CBAM 注 意 力 机 制 及 其 改进 
传统 卷 积 神经 网 络 提取 的 特征 不 加 区 分 地 传输 
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至 下 一 层 ， 因 而 无 法 注意 到 所 需 有 效 信息 。 尤 其 在 
弱 监 督 的 条 件 下 。 针 对 此 问题 ， 本 文 在 卷 积 神 经 网 
络 中 融入 注意 力 机 制 。 

CBAM "由 通道 注意 力 机 制 (Channel Atten- 
CAM) 结合 空间 注意 力 机 制 
(Spartial Attention Module, SAM) "组 成 。 它 首先 
对 特征 图 UU 进行 平均 池 化 和 全 局 池 化 ， 使 其 压缩 为 
1X1XC 格 式 ， 接 着 将 两 个 压缩 特征 图 送 入 含有 两 
层 神 经 网 络 的 MLP 中 ， 在 这 两 层 的 神经 网 络 的 中 
间 含 有 一 个 隐藏 展 ， 使 压缩 后 的 1X1XC 特 征 图 降 
维 至 1X1XCAr， 将 经 过 MLP 的 输出 进行 基于 ele- 
ment-wise 的 加 和 操作 ， 最 终 通过 Sigmoid 函数 产生 
通道 注意 力 特征 权重 ， 使 其 作用 于 特征 图 U 中 产生 
新 的 特征 图 。 空 间 注 意 力 机 制 能 够 实现 图 像 空 间 中 
关键 特征 信息 的 提取 ， 是 通道 注意 力 的 补充 。 

由 于 苹果 叶 部 病害 尺寸 小 是 分 布 十 分 密集 ， 准 
确 快 速 的 识别 对 细节 特征 提取 要 求 较 高 。 为 了 让 
CBAM 更 好 注意 到 图 像 病 害 的 细节 ， 本 研究 将 
CBAM 通道 注意 力 模块 中 的 共享 神经 网 络 进行 改 
进 ， 如 图 3 所 示 。 原 共享 神经 网 络 是 先 将 1X1XC 
的 图 片 降 维 至 1X1XCm 后 再 升 维 至 1X1XC 的 特 
征 图 ,但 由 于 降 维 对 细节 损失 较 大 ， 对 最 终生 成 的 
通道 注意 力 特征 权重 产生 影响 ， 无 法 重视 细节 特 
征 。 改 进 的 CBAM 注意 力 机 制 改 为 先 升 维 再 降 维 ， 
即 先 将 1X1XC 的 图 片 升 维 至 1X1XrC 后 再 降 维 至 
1X1XC 的 特征 图 ， 提升 CBAM 注 意 力 机 制 对 苹果 
叶 部 病害 的 分 辩 能 力 。 


3.3 SeLU Wik A RESI 


当 模型 过 大 、 参 数 过 多 时 ， 模 型 训练 容易 过 拟 
合 。 针 对 此 问题 ， 引 入 Dropout 使 模型 达到 正则 化 
的 效果 。Dropout 是 让 一 部 分 神经 元 失 活 以 提高 模 
型 的 泛 化 能 力 ， 但 每 经 过 一 次 Dropout， 激 活 值 的 
分 布 可 能 发 生变 化 。 对 此 ，Klambauer 等 ° pE T 
和 一 种 新 的 激活 函数 SeLU， 能 
持 输 入 与 输出 的 均值 和 标准 差 保持 一 致 ， 归 一 化 性 
质 不 变 。 

相 比 于 激活 函数 ReLU (Rectified Linear Acti- 
vation Function) 2 ，SeLU 不 存在 失 活 区 ， 如 公 
式 〈D， 在 负 无 穷 存在 但 和 区 ， 模 型 的 表达 不 会 受 


tion Module, 


AlphaDropout, 


= big aff 


ENG iii 


注 : Mc 表示 通道 注意 力 权重 ;Ms 表示 空间 注意 力 权 重 
图 3 改进 的 CBAM 注意 力 机 制 


Fig. 3 The improved channel CBAM attention mechanism 


其 影响 。 经 过 SeLU 激 活 后 ， 样 本 分 布 自动 归 一 化 
到 0 均值 和 单位 方差 ,保证 在 训练 的 过 程 中 梯度 不 
会 爆炸 和 消失 。 

wa ae (1) 

ae- a,x <0 

其 中 ,入 和 a 为 超 参数 ， 入 约 为 1.05， 
1.67; x 为 输入 量 。 

本 研究 将 AlphaDropout 配合 SeLU 使 用 ,使 特 
征 图 输入 的 分 布 不 发 生变 化 ， 模 型 能 够 更 好 防止 过 
拟 合 ， 提 高 收敛 速度 和 效果 。 


3.4 余弦 退火 算法 调整 学 习 率 
本 研究 采用 单 周期 的 余弦 退火 算法 ”衰减 学 


an 约 


JK, WAR (2) 所 示 ， 由 于 本 人 研究 为 单 周期 ， 
所 以 i 为 1， 和 ww 分别 表 示 学 习 率 的 最 大 值 与 


最 小 值 ， 规 定 了 学 习 率 的 范围 ,表示 当前 执行 的 
轮 数 ， 在 每 轮 中 的 每 批 训练 完 进行 更 新 ， 工 为 总 轮 
数 ， 本 研究 的 预 训练 阶段 工 为 100， 训 练 阶段 为 50。 
在 开始 融入 warmup 阶段 ， 学 习 率 非常 小 ， 防 止 较 
大 的 学 习 率 使 模型 产生 动荡 ， 稳 定 模型 ，warmup 


阶段 结束 后 开始 余弦 退火 优化 学 习 率 。 
= Maa + 5 Ml = ue) (1 + cos ( 2" “x)) (2) 
re ere en 


值 ; 7 为 当前 执行 轮 数 ; T; 为 总 轮 数 。 
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3.5 改进 ResNet18 的 病害 识别 模型 
综合 以 上 ， 本 研究 对 ResNet18 模 型 进行 改进 ， 


Resl Res2 Res3 
n=2 n=2 n=2 


ROT ces Oe aia MN es A OR. 
1 最 大 池 化 zz Yi, p AT 
S-c-2-0-0-0-9-a-0-=-- =: 


提出 了 一 种 苹果 叶 部 病害 识别 模型 CBAM- 
ResNet18， 结 构 如 图 4 所 示 。 

Res4 

n=2 


Ate Eee FC Softmax 病害 1 
池 ropou 病害 2 


图 4 改进 的 CBAM-ResNet18 革 果 叶 部 病害 识别 模型 


Fig. 4 Improved CBAM-ResNet18 apple leaf disease recognition model 


在 网 络 的 每 一 个 Res 模 块 中 融入 改进 的 CBAM 
注意 力 机 制 ， 以 更 好 地 获取 病害 细节 信息 ,减少 复 
ARP THE; 将 ReLU 替换 为 SeLU 并 融入 AlphaD- 
ropout， 避 免 神经 元 “ 失 活 ”， 防 止 模 型 过 拟 合 ， 保 
持 输 入 与 输出 分 布 一 致 ， 使 用 单 周 期 余弦 退火 优化 
算法 优化 学 习 率 ， 使 模型 在 收敛 过 程 中 保持 稳定 ， 
避免 出 现 动荡 。 

改进 模型 的 输入 为 224X224 像 素 RGB 图 像 。 
先 经 卷 积 层 和 池 化 层 对 图 像 特征 进行 初步 提取 与 降 
维 ， 得 到 56X56 像 素 的 特征 图 ， 接 着 特征 图 进入 4 
A Res 模块 进一步 提取 病害 特征 °°, HEA Res 模块 
后 ， 首 先 使 用 3X3 的 核对 特征 图 卷 积 ， 接 着 经 过 
激活 函数 SeLU 和 AlphaDropout 模块 ， 再 次 进行 
3X3 的 卷 积 ， 使 用 归 一 化 模块 (Batch Normaliza- 
tion, BN) 后 , 插入 CBAM 模 块 产生 特征 权重 ; 在 
改进 的 CBAM 通道 注意 力 机 制 中 ， 特 征 图 先进 行 通 
道 升 维 、 再 降 分 别 降 维 至 1X1X64，1X1LX128， 
1X1X256 和 1X1X512， 获 得 特征 系数 ， 最 后 与 
输入 特征 图 相 乘 得 到 新 的 特征 图 。4 个 Res 模块 均 
使 用 3X3 的 卷 积 核 ， 数 量 分 别 为 64、128、256 和 
512， 特 征 图 的 像素 尺寸 分 别 为 56X56、28X28、 
14X14 和 7X7。 

在 全 局 平均 池 化 (Global Average Pooling, 
GloPooling) 、 全 连接 (Fully Connected) 之 中 ,本 
人 研究 加 入 了 AlphaDropout 模 块 以 防止 模型 过 拟 合 。 


使 用 Softmax 函数 进行 分 类 ， 如 公式 (3) WR, 将 
概率 最 大 值 作为 结果 输出 ， 完 成 苹果 叶 部 病害 的 


识别 。 


i N (3) 


N 
e 


Softmax (x; ) = 


ER, ARAS AMARE Det 
HAE S RARA. 
4 试验 结果 与 分 析 


41 模型 训练 环境 与 参数 设置 


模型 训练 所 用 CPU 配置 为 Intel®Core™ i7- 
11800H @2.30 GHz， RTX 3060 Laptop GPU， 显 存 
为 6GB， 内 存 为 16 GB， 基 于 Windows10 操 作 系 统 
All Tensorflow 深度 学 习 框 架 搭建 了 深度 学 习 算 法 训 
练 平台 ， 其 中 Python 版 本 为 3.9.7，Tensorflow 版 本 
为 2.8.0。 

基于 迁移 学 习 思 想 ， 本 研究 的 模型 训练 分 为 预 
训练 和 训练 两 个 阶段 。 预 训练 阶段 在 周 敏 敏 ” 数 
据 集 上 学 习 并 保存 最 佳 模型 ， 之 后 再 利用 蓝 县 数据 
集 进 行 再 训练 。 在 预 训练 阶段 ， 输 入 图 像 分 辨 率 为 
224X224 像 素 ; 批 处 理 大 小 (Batch size) 为 16， 
所 有 训练 样本 迭代 一 次 为 一 轮 ， 和 迭代 轮 数 (Ep- 
ochs) 为 100 轮 ， 采用 自 适应 矩阵 估计 算法 (Adap- 
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tive Moment Estimation, ADAM) 对 模型 进行 优 
A, WR (AAR ME L tid FE KZ (Cross Entropy 
Loss)。 为 了 在 保持 稳定 训练 的 同时 加 速 模 型 收敛 ， 
初始 学 习 率 设置 为 10"。 经 过 15 个 轮 和 迭代 的 
warmup 阶段 后 上 升 为 0.001， 使 用 余弦 退火 算法 调 
整 学 习 率 ， 最 后 衰减 至 0。 训 练 阶段 仅 将 迭代 轮 数 
(Epochs) 和 warmup 阶段 轮 数 置 为 50 轮 和 10 轮 ， 
其 余 均 与 预 训练 相同 。 


4.2 消融 实验 


为 了 探究 在 弱 监 督学 习 条 件 下 ， 改 进 的 CBAM 
共享 神经 网 络 升 维 的 最 佳 维度 ， 同 时 验证 改进 
CBAM 对 识别 苹果 叶 部 病害 的 提升 效果 ，AlphaD- 


ropout 配合 激活 函数 SeLU 使 用 与 配合 ReLU 使 用 之 
间 的 差异 ， 以 及 单 周期 余弦 退火 优化 算法 与 动态 指 
数 衰 减 两 种 学 习 率 衰减 策略 对 模型 学 习 的 影响 ， 进 
行 3 组 消融 实验 。 
4.2.1 改进 的 CBAM 的 影响 

为 探究 改进 的 CBAM 对 Resnet18 网 络 的 影响 , 
以 及 通道 注意 力 机 制 升 维 的 最 佳 维度 ， 在 原 
Resnet18 网 络 的 基础 上 上， 进行 4 组 不 同 MLP 的 设 
置 , 第 (1) 组 为 原 Resnet18 网 络 中 融入 原 CBAM ， 
第 (2) ~ (4) 组 分 别 将 CBAM 中 共享 神经 网 络 改 
进 为 先 升 维 至 1X1X2C、1X1xX3C 和 1X1xX5C 
后 ， 再 降 维 为 1X1XC。 在 相同 的 数据 集 上 进行 训 
练 和 测试 ， 结 果 如 表 2 所 示 。 


表 2 CBAM 中 共享 神经 网 络 不 同 的 升 维 策略 下 模型 的 性 能 


Table 2 The performance of the model under different dimension-up strategies of the shared neural network in CBAM 


组 号 升 维 策略 特征 图 大 小 准确 率 /% 参数 量 训练 时 长 人 轮 's-) 
1) Jk CBAM 1X1XC/2 98.12 11,889,885 145 
2) 1X1X2 1X1X2C 98.44 13,981,725 137 
3) 1X1X3 1X1X3C 97.14 15,376,285 142 
4) 1X1X5 1X1X5C 97.99 18,165,405 140 
5) 不 采用 CBAM 一 97.99 11,189,893 143 


由 表 2 可 见 ， 改 进 的 注意 力 机 制 将 特征 图 升 维 
至 1X1X2C 的 效果 最 好 ， 其 准确 率 分 别 高 于 其 他 
两 种 升 维 方式 1.3% 和 0.45%， 较 原 CBAM 注意 力 
机 制 准确 率 提 升 了 0.32%; 且 升 维 至 1x1x2C 参数 
量 比 对 照 组 (3) 低 9.97%， 比 对 照 组 (4) 低 
29.92%， 比 原 CBAM 高 17.59% 情况 下 ， 以 最 快 学 
习 速 度 完成 训练 ， 相 比 于 对 照 组 (1)、(3) 和 “(4) 
分 别 缩短 8s、5s 和 3 so 

以 上 试验 结果 表明 ， 将 特征 图 由 压缩 变 为 升 
维 ， 能 将 图 像 病 害 细节 放大 ， 从 而 有 效 提取 图 像 病 
害 的 细节 ; 但 奇 升 维 过 大 ， 也 会 将 复杂 背景 哄 声 放 
大 ， 影 响 识别 。 故 综合 考虑 准确 率 、 参 数量 及 学 习 
效率 ， 本 研究 选用 共享 神经 网 络 升 维 1X1X2C 的 
改进 注意 力 机 制 。 

4.2.2 AlphaDropout 配 合 SeLU 使 用 的 影响 

为 验证 AlphaDropout 配合 SeLU 使 用 对 
ResNet18 网 络 在 弱 监 督学 习 条 件 下 识别 苹果 叶 部 病 
害 的 影响 ， 在 原 ResNet18 网 络 的 基础 上 ， 分 别 测试 
AlphaDropout+ReLU, AlphaDropout +SeLU 和 Jit 


ResNet 三 种 模型 ， 在 同样 条 件 下 三 种 模型 的 识别 结 
果 如 表 3 所 示 ， 可 见 与 ReLU 相 比 ，AlphaDropou+ 
SeLU 的 准确 率 最 高 为 97.34%， 较 AlphaDropou+ 
ReLU 提高 0.13% ， 且 每 轮 的 训练 时 长 减少 2 s。 这 
是 因为 SeLU 有 效 避 免 神经 元 “ 失 活 ” 问 题 ， 提 高 
模型 表达 能 力 ， 且 其 自 归 一 化 性 质 配合 AlphaDrop- 
out 一 起 使 用 ,保证 了 输出 是 0 均值 和 单位 标准 差 ， 
使 得 模型 收敛 速度 加 快 。 
表 3 不 同 激活 函数 的 模型 性 能 表现 


Table 3 Model performances with different activation functions 


模型 准确 率 /% 训练 时 长 / 轮 :sS) 
AlphaDropou+ReLU 97.21 147 
AlphaDropou+SeLU 97.34 145 
原 模型 96.97 143 


42.3 单 周期 的 余弦 退火 优化 算法 的 影响 

为 探究 单 周 期 余弦 退火 优化 算法 对 本 模型 的 影 
响 ， 将 其 与 动态 指数 衰减 学 习 率 作对 比 ， 观 察 模 型 
性 能 表现 。 

由 表 4 可 知 ， 余 弦 退 火 优 化 算法 对 于 学 习 率 的 
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表 4 不 同学 习 率 调节 方式 的 模型 性 能 
Table 4 Model performances with different learning rate adjust- 


ment methods 


模型 准确 率 /% 训练 时 长 / 轮 :s-) 
单 周 期 余弦 退火 97.99 143 
动态 指数 衰减 97.90 143 
固定 学 习 率 96.92 143 


调节 更 符合 改进 的 CBAM-ResNet18 模型 的 学 习 ， 


一 一 指数 衰减 


100.00 
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准确 率 /% 
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迭代 次 数 
(a) 预 训练 过 程 验证 集 准 确 率 


在 前 期 warmup 阶段 能 稳定 模型 ， 后 期 按 余弦 退火 
优化 算法 进行 调节 使 模型 更 好 地 学 习 病 害 的 特征 ， 
准确 率 比 动态 衰减 学 习 率 提升 0.09%。 图 5 为 采用 
不 同 的 学 习 率 学 习 验 证 集 的 准确 率 变化 曲线 。 由 
图 5 可 见 ， 余弦 退火 算法 优化 的 学 习 率 在 后 期 衰减 
合理 ， 使 得 训练 过 程 快 速 进 入 收敛 且 保 持 较 高 的 准 
确 率 。 指 数 衰减 学 习 率 在 同样 的 训练 轮 次 后 仍 有 较 
大 波动 ， 模 型 收敛 不 好 。 


一 一 余弦 退火 
10.0 


EARL 
(b) 预 训练 过 程 验证 集 损失 值 


图 5 指数 衰减 和 余弦 退火 算法 优化 模型 的 学 习 过 程 中 验证 集 准 确 率 变化 曲线 


Fig. 5 The variation curve of validation set accuracy during the learning process of exponential index decay and cosine annealing al- 


gorithm optimization model 


4.3 预 训练 过 程 对 比分 析 


得 出 改进 模型 的 最 佳 参 数 后 ， 测 试 改 进 的 
CBAM-ResNet18 模型 预 训练 过 程 中 性 能 表现 ， 在 
同样 的 条 件 下 ， 分 别 对 ResNet18，ResNet52， 
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IERA 
(a) 预 训练 过 程 中 验证 集 准 确 率 


DesNet121, VGG16, Xception, ResNeXtS0, Effi- 
cientNet-BO 和 本 研究 改进 的 CBAM-ResNet18 模型 
进行 预 训练 ， 各 个 模型 在 预 训练 后 在 验证 集 上 的 准 
确 率 与 损失 值 如 图 6 所 示 。 


12.0 
— Desnet121 
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at 80 —— VGG16 
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(b) 预 训练 过 程 中 损失 值 


0.0 


图 6 不 同 模型 在 预 训 练 过 程 中 测试 集 的 准确 率 与 损失 值 变 化 曲线 


Fig. 6 The curve of accuracy and loss value of the test set during the training process of different models 


从 图 6 可 见 ， 随 着 训练 轮 数 的 增加 ， 除 了 
VGG16 模 型 外 的 7 种 模型 在 验证 集 上 的 准确 率 整 体 
上 呈现 上 升 趋势 ， 损 失 率 则 下 降 至 一 个 相对 稳定 的 


区 间 内 振荡 。 而 VGG16 准确 率 一 直 停 留 21% 左 右 ， 
无 法 收敛 。 在 收敛 后 的 模型 中 。EfficientNet-B0 波 
动 大 ， 准 确 率 在 00% 左右 且 波 动 起 伏 过 大 ， 收 敛 效 
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果 不 佳 。ResNet18 和 Resnet50 在 收敛 后 ， 模 型 准确 
率 在 96% 左右 有 较 大 的 振荡 ，ResNet18 比 Resnet50 
的 振荡 更 明显 ， 甚 至 会 降 到 80%~60%， 而 损失 值 
在 0.2 左 右 有 较 大 的 振荡 。 具 有 多 尺度 结构 的 Xcep- 
tion 和 ResNeXt50 收 敛 后 较为 稳定 ， 准 确 率 在 96% 
左右 伴随 较 小 震荡 ， 损 失 值 稳定 在 0.1 左 右 。 
DesNet121 准确 率 和 损失 值 分 别 稳 定 在 96% 和 0.1 左 
右 ， 相 比 于 ResNet50 较 好 。 这 是 由 于 在 弱 监督 的 条 
件 下 ， 没 有 像素 级 的 标注 ， 模 型 对 有 效 的 病害 特征 
学 习 能 力 不 足 ， 无 法 稳定 其 准确 率 和 损失 值 ， 产 生 
了 较 大 的 波动 。 相 比 之 下 ， 本 研究 改进 的 CBAM- 
Resnet18 模 型 的 曲线 相对 平滑 ,波动 小 于 其 他 模 
型 ， 表 现 明 显 更 为 稳定 。 


44 病害 识别 试验 及 结果 分 析 


为 进一步 对 比 模型 对 于 苹果 叶 部 病害 识别 的 效 
果 ， 将 预 训 练 好 的 模型 保存 并 迁移 至 训练 集 图 像 上 
进行 迁移 学 习 ， 以 调整 参数 获得 目标 模型 ， 最 后 在 
测试 集 上 进行 病害 识别 实验 ， 测 试 模型 的 分 类 性 
能 。 采 用 准确 率 、 参 数量 和 训练 时 长 对 模型 性 能 进 
行 评价 ， 其 中 准确 率 如 公式 (4) 所 示 。 试 验 结果 
如 表 5 所 示 。 


TP + TN (4) 
TP + FP + TN + FN 


其 中 ，TP 为 被 模型 预测 为 正 类 的 正 样本 个 数 ; 
TN 为 被 模型 预测 为 负 类 的 负 样 本 个 数 ; FP 为 被 模 
型 预测 为 正 类 的 负 样 本 个 数 ; FN 为 被 模型 预测 为 
负 类 的 正 样本 个 数 。 


Accuracy = 
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表 5 不 同 模 型 的 苹果 叶 部 病害 识别 性 能 表现 


Table 5 Performance comparison of different classic networks of apple leaf disease recognition 


模型 验证 集 准确 率 /% 测试 集 准确 率 /% 参数 量 训练 时 长 /( 轮 :s) 
VGG16 21.44 20.51 134,281,029 186 
DesNet121 97.12 98.12 7,042,629 188 
ResNet50 97.05 98.18 23,597,957 156 
ResNeXt50 97.14 97.29 23,084,933 442 
ResNet18 96.97 96.97 11,189,893 143 
EfficientNet-B0 94.36 90.12 4,055,969 147 
Xception 97.26 97.93 20,778,725 234 
CBAM-ResNet18 97.38 98.44 13,981,725 137 

由 表 5 可 见 ， 与 VGG16、 DesNetl21, 相对 于 ResNet18 在 参数 量 增加 24.9% 的 情况 下 ,不 


ResNet50,. ResNeXt50、 ResNet18. EfficientNet-BO 
All Xception 相 比 ， 本 研究 提出 的 改进 CBAM- 
ResNet18 在 测试 集 上 的 准确 率 分 别 高 出 77.93%、 
0.32%、0.26%、1.15%、1.47%、8.32% 和 0.51%。 
ResNet50 利 用 残 差 结构 确保 其 具有 很 强 的 特征 学 习 
能 力 ， 因 此 可 以 达到 98.18% 的 准确 率 。 
DenseNet121 的 基本 结构 Dense Block 具 有 增强 特征 
传播 和 激励 特征 重用 的 优点 ， 使 其 以 ResNet50 三 分 
之 一 的 参数 获得 相近 的 准确 率 。 此 外 ，ResNeXt50 
的 训练 时 间 达 到 了 442 s/ 轮 ， 这 是 由 于 大 量 并 行 分 
文 的 存在 ， 大 大 降低 了 模型 的 计算 效率 。 与 
ResNeXt50 类 似 ，Xception 也 具有 多 尺度 结构 ， 这 
就 导致 了 模型 参数 之 间 的 交叉 计算 ， 导 致 计算 时 间 
偏 高 。 相 比 之 下 ， 本 研究 改进 的 CBAM-ResNet18 


但 未 造成 以 往 卷 积 神经 网 络 参 数量 的 增加 带 来 学 习 
效率 降低 的 负面 影响 ， 反 而 学 习 效 率 和 速度 均 得 到 
提升 ， 每 轮训 练 时 间 缩 短 6 s。 这 是 由 于 改进 的 注 
意 力 机 制 使 卷 积 层 能 够 更 迅速 地 关注 到 了 特征 图 的 
病害 特征 ， 提 高 特征 学 习 速 率 和 训练 效率 ， 在 参数 
量 增加 的 情况 下 减少 了 训练 时 间 。 相 对 于 同 为 残 差 
网 络 的 ResNet50， 改 进 的 CBAM-ResNet18 保持 了 
残 差 网 络 ResNet18 的 低 参数 量 ， 每 一 轮训 练 时 间 缩 
短 19s， 且 准确 率 高 出 0.26%， 为 部 署 在 更 多 存储 
量 较 小 、 运 算 性 能 配置 不 高 的 硬件 终端 设备 提供 了 
可 能 性 。 

以 上 结果 表明 ， 对 于 苹果 叶 部 病害 的 小 有 旦 分 布 
密集 的 特征 ， 改 进 的 CBAM-ResNet18 模 型 在 缺少 
像素 级 标注 的 弱 监 督学 习 条 件 下 ， 能 够 有 效 地 提取 
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特征 ， 改 进 的 CBAM 注意 力 机 制 能 够 强化 网 络 对 图 
像 中 特定 显著 区 域 特征 表达 能 力 ， 带 来 较 其 他 网 络 
更 高 的 准确 率 ， 低 参数 量 ， 同 时 大 大 提高 学 习 病 害 
效率 ， 减少 学 习 时 间 。 
45 多 类 别 识别 混淆 和 矩阵 

混 消 和 矩阵 常用 来 进行 多 分 类 性 能 评估 。 本 研究 
共 涉 及 5 种 苹果 叶 部 病害 ， 用 改进 的 CBAM- 
ResNet 18 模型 对 测试 集 数据 进行 分 类 识别 实验 ， 得 
到 混 消 和 矩阵 如 图 7 所 示 。 


识别 种 类 


RAIE ep 花 叶 靖 ABE 锈病 
内 


mks 


ARBEN 


花 叶 病 


真实 种 类 


BEG 


锈病 


图 7 革 果 叶 部 病害 测试 集 的 混淆 矩阵 
Fig.7 Confusion matrix of apple leaf disease test Set 
混 消 和 矩阵 中 判断 模型 性 能 的 指标 通常 有 精确 度 
(Precision) 、 召 回 率 (Recall) 和 分 数 (F, 
Score) ， 公 式 如 (5) ~ (7)。 


工 
ON 4 
Prescision TP 4 EP 100% (5) 
TP 
= x 
Recall TP a EN 100% (6) 


a= 2 X Prescision X Recall (7) 
' Prescision + Recall 


其 中 ，TP 和 FN 表示 病害 样本 被 正确 识别 为 某 
种 类 和 非 某 种 类 的 数量 , 个 ; FP 和 TN 表示 病害 样 
本 被 错误 识别 为 某 种 类 和 非 某 种 类 的 数量 ， 个 。 精 
确 度 为 所 有 预测 为 某 类 别 的 样本 中 预测 正确 的 比 
例 ，%; 召回 率 表 示 所 有 真实 类 别 中 预测 正确 的 比 
例 ，%; 分 数 是 精确 率 和 召回 率 的 调和 平均 数 ， 
是 二 者 的 综合 评价 。 根 据 图 7 的 混淆 和 矩阵， 得 到 5 
种 苹果 叶 部 病害 种 类 识别 试验 结果 如 表 6 所 示 。 

由 表 6 可 知 ， 改 进 的 CBAM-ResNet 模 型 在 精 
确 度 、 召 回 率 和 分 数 上 均 取 得 良好 的 结果 。 由 
图 7 可 知 ， 本 研究 改进 的 模型 最 多 的 误 识 别 为 灰 斑 
病 与 斑点 落叶 病 两 种 病害 ， 斑 点 落叶 病 中 有 10 幅 
图 像 被 识别 错误 ， 且 均 被 误 认为 成 灰 斑 病 ， 而 灰 斑 


表 6 5 类 苹果 叶 部 病害 的 精确 度 、 召 回 率 、 厂 分 数 的 实验 结果 
Table 6 Experimental results of precision, recall, and F, scores 


for 5 types of apple leaf diseases 


病害 类 KAR atone ra Aa 
斑点 落叶 病 “248 97.74 96.81 0.9727 2.26 
灰 斑 病 250 96.82 97.12 0.9697 3.18 
花 叶 病 229 98.61 99.65 0.9913 1.39 
褐 斑 病 258 99.37 100.00 0.9968 0.63 
锈病 252 99.60 98.74 0.9921 0.40 
平均 值 — 98843 98.46 0.9845 1.57 


病 中 7 幅 图 像 被 识别 错误 ， 且 均 被 识别 为 斑点 落叶 
病 ， 这 是 由 于 灰 斑 病 在 苹果 叶片 上 为 黄 褐色 圆 点 ， 
斑点 落叶 病 为 褐色 圆 点 ， 两 者 颜色 、 形 态 、 大 小 分 
布 都 十 分 相似 ， 故 而 易 造 成 混淆 。 其 他 3 种 病害 的 
精确 度 ， 召 回 率 和 FF 分 数 均 接 近 100%， 识 别 效果 
较 好 ; 其 中 有 4 幅 锈 病 图 像 被 识别 为 花 叶 病 ，1 幅 
花 叶 图 片 被 识别 为 锈病 ， 由 于 密集 分 布 的 锈病 图 像 
与 花 叶 病 图 像 十 分 相似 ， 被 错误 识别 ; 另外， 由 于 
褐 斑 病 叶 面 为 绿色 叶 面 ， 有 褐色 斑点 ， 因 此 有 2 幅 
灰 斑 病 被 错误 地 识别 为 小 面积 的 褐 贷 病 。 总 体 误 识 
别 数 较 少 ， 表 明 改 进 的 CBAM-ResNet 模 型 性 能 良 
好 ， 能 够 适用 于 实际 场景 下 苹果 叶 部 病害 的 识别 。 


5 结 论 


针对 仅 有 图 像 标 签 弱 监 督学 习 条 件 下 无 法 快速 
有 效 关注 苹果 叶 部 病害 图 像 特 征 ， 识 别 准确 率 和 学 
习 效 率 低 的 问题 ， 本 研究 提出 了 一 种 苹果 叶 部 病害 
识别 模型 ， 在 ResNet18 模型 中 插入 CBAM 的 基础 
上 ， 为 了 更 好 地 关注 病害 特征 ， 对 CBAM 中 MLP 
进行 改进 ， 先 升 维 以 更 好 地 突出 了 苹果 叶 部 病害 的 
夺 征 细节 后 ， 让 模型 能 够 更 加 有 效 病害 特征 更 好 地 
学 习 病 害 特征 及 细节 ， 再 进行 降 维 ; 同时 对 激活 也 
数 以 及 学 习 率 进行 改进 ， 提 高 了 模型 的 训练 效率 ， 
更 注重 于 病害 细节 的 学 习 。 得 到 以 下 结论 : 

(1) 以 ResNet18 为 基础 模型 ， 在 每 一 个 残 差 块 
中 插入 CBAM， 采用 升 维 MLP 改 进 CBAM， 将 先 
降 维 后 升 维 的 MLP 改进 为 先 升 维 后 降 维 ， 可 有 效 
放大 蕴 果 图 像 病 害 特征 的 细节 ， 提 升 卷 积 层 对 于 病 
害 特 征 的 提取 效率 。 

(2) 在 弱 监 督学 习 的 条 件 下 ， 改 进 的 CBAM- 
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ResNet18 网 络 模型 对 5 种 苹果 叶 部 病害 平均 识别 准 
确 率 达 98.44%， 不 仅 在 准确 率 上 超过 了 对 照 模型 
(VGG16, DesNet121， ResNet50, ResNeXt50, 
ResNet18，EfficientNet-B0，Xception) ， 而 且 相 对 
于 原 模型 ResNet18 在 参数 量 增加 24.9% 的 情况 下 ， 
不 但 未 造成 以 往 卷 积 神经 网 络 参 数量 的 增加 带 来 学 
习 效 率 降 低 ， 训 练 时 长 增加 的 负面 影响 ， 反 而 学 习 
效率 和 速度 均 得 到 提升 ， 每 轮训 练 时 间 相 对 于 原 模 
型 ResNet18 减 少 了 6s， 且 高 于 所 有 对 照 模 型 。 

(3) 通过 混淆 矩阵 对 种 类 识别 结果 分 析 ，5 种 
病害 的 精确 度 平均 值 、 召 回 率 平均 值 、F 分 数 平均 
值 分 别 达 到 了 98.43%、98.46% 和 0.9845， 其 中 花 
IH. RDA. SURI EE. A Oey 
值 、 忆 分 数 十 分 接近 100% ， 验 证 了 改进 的 CBAML- 
ResNet18 模型 性 能 优越 ， 能 够 有 效 分 辨 苹果 病害 。 

(4) 虽然 基于 弱 监 督学 习 的 条 件 下 能 够 有 效 关 
注 到 鞋 果 叶 部 病害 的 特征 细节 实现 优秀 的 准确 率 和 
学 习 效 率 ， 但 本 模型 的 大 小 与 参数 量 仍 有 提升 空 
间 。 同 时 ， 考 虑 建立 基于 云 服务 的 苹果 叶 部 病害 识 
别 诊断 服务 系统 ， 并 开发 移动 端 App， 以 满足 产业 
应 用 需求 。 


利益 冲突 声明 : 本 研究 不 存在 研究 者 以 及 与 公开 
研究 成 果 有 关 的 利益 冲突 。 
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Identifying Multiple Apple Leaf Diseases Based on the 
Improved CBAM-ResNet18 Model Under Weak Supervision 
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Abstract: To deal with the issues of low accuracy of apple leaf disease images recognition under weak supervision with only image cat- 
egory labeling, an improved CBAM-ResNet-based algorithm was proposed in this research. Using ResNet18 as the base model, the 
multilayer perceptron (MLP) in the lightweight convolutional block attention module (CBAM) attention mechanism channel was im- 
proved by up-dimensioning to amplify the details of apple leaf disease features. The improved CBAM attention module was incorpo- 
rated into the residual module to enhance the key details of AlphaDropout with SeLU (Scaled Exponential Linearunits) to prevent 
overfitting of its network and accelerate the convergence effect of the model. Finally, the learning rate was adjusted using a single-cy- 
cle cosine annealing algorithm to obtain the disease recognition model. The training test was performed under weak supervision with 
only image-level annotation of all sample images, which greatly reduced the annotation cost. Through ablation experiments, the best 
dimensional improvement of MLP in CBAM was explored as 2. Compared with the original CBAM, the accuracy rate was increased 
by 0.32%, and the training time of each round was reduced by 8 s when the number of parameters increased by 17.59%. Tests were 
conducted on a dataset of 6185 images containing five diseases, including apple spotted leaf drop, brown spot, mosaic, gray spot, and 
rust, and the results showed that the model achieved an average recognition accuracy of 98.44% for the five apple diseases under 
weakly supervised learning. The improved CBAM-ResNet18 had increased by 1.47% compared with the pre-improved ResNet18, and 
was higher than VGG16, DesNet121, ResNet50, ResNeXt50, EfficientNet-BO and Xception control model. In terms of learning effi- 
ciency, the improved CBAM-ResNet18 compared to ResNet18 reduced the training time of each round by 6 s under the condition that 
the number of parameters increased by 24.9%, and completed model training at the fastest speed of 137 s per round in VGG16, 
DesNet121, ResNet50, ResNeXt50, Efficient Net-BO and Xception control models. Through the results of the confusion matrix, the 
average precision, average recall rate, and average F, score of the model were calculated to reach 98.43%, 98.46%, and 0.9845, respec- 
tively. The results showed that the proposed improved CBAM-ResNet18 model could perform apple leaf disease identification and 
had good identification results, and could provide technical support for intelligent apple leaf disease identification providing. 

Key words: disease identification; residual network; attentional mechanisms; cosine annealing learning rate; transfer learning; convolu- 


tional block attention module (CBAM); multilayer perceptron (MLP) 
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